سامانهی اتاق خبر صبا
معرفی و شرح خدمات
اتاق خبر صبا، یک بسته جامع خبری است که برای پاسخگویی به تمامی نیازمندیهای یک خبرگزاری متوسط و بزرگ طراحی و پیادهسازی شده است. این نرمافزار با بهرهگیری از جدیدترین فناوریهای نرمافزاری موجود در حوزۀ وب تولید شده و در آن سهولت استفاده به عنوان مهمترین هدف تولیدکنندگان مدنظر قرار گرفته است. رابط کاربری بسیار ساده است و کار با آن دلچسب.
این سامانه مبتنی بر کارتابل است و هر کاربر کارتابل مربوط به سمت یا سمتهای خود را مشاهده میکند. برخی کاربران مانند دبیران و سردبیران بسته به دسترسی به سرویسها و زیرسرویسهای مشترک، اخبار مشترک را در کارتابل خود مشاهده میکنند و برخی در صورت اعطای دسترسی اختصاصی، کارتابل اختصاصی خود را میبینند.
چرخۀ کامل خبری (news workflow) که در این سامانه پیشبینی شده مبتنی بر نیاز یک خبرگزاری متوسط و بزرگ (با نقشها و دسترسیهای متنوعی همچون خبرنگار، دبیر، دبیر سرویس، دبیر بخش، سردبیر، سردبیر کل، مدیر اداره، مدیر آرشیو، مدیر کل، مدیر سامانه، عکاس، دبیر سرویس عکس، مدیر تبلیغات، مدیر کلیدواژهها، مدیر برچسبها و ...) است و دسترسیها و سمتها به صورت ریز قابل تفکیک و دستهبنده است. هر کاربر میتواند به یک یا چند سرویس و زیر سرویس دسترسی داشته باشد. چیدن صفحۀ اصلی سایت بر اساس دسترسی به باکسهای خبری است که مدیر در اختیار دبیران یا سردبیران قرار میدهد.
این سامانه با استفاده از فناوری Java EE 6 تولید شده و امکان اجرای سرور آن بر روی کلیۀ سکوهای مورد استفاده نظیر Windows همۀ نسخههای از (2000 به بعد)، لینوکس (تمامی توزیعها) و Apple OS X را داراست. تمامی مرورگرهای مدرن (MS Internet Explorer, Mozilla Firefox, Google Chrome, Opera) امکان دیدن صفحات سامانه را دارند. به علاوه به دلیل استفاه از میانافزارهای استاندارد (middleware)، امکان بهرهگیری از اکثر پایگاههای دادۀ قدرتمند و مشهور نظیر MS SQL Server، Oracle Database، Oracle MySQL و PostgreSQL را دارد.
فناوری واسط کاربری بر اساس استاندارد HTML 5 و مؤلفههای استاندارد PrimeFaces تولید شده و بر روی مرورگرهای مدرن نظیر Chrome 5+، Firefox 3+، Safari 5+ و Internet Explorer 8+ و همچنین اکثر گوشیهای همراه و تبلتها کار میکند. رابط کاربری بسیار ساده و جذاب است و حدود ۳۰ مضمون/پوستۀ گرافیکی از پیش برای آن طراحی شده است.
برخی از استفادهکنندگان فعلی این نسخه از سامانه را در اینجا مشاهده کنید :
همچنین سایت خبری صاحبخبر که به عنوان یک پایگاه خبری جمعآوری و ساماندهی خودکار خبری با بهرهگیری از ربات پایش هرمس عمل میکند، خروجی و پنل مدیریتی را در سایت قالب اتاق خبر ارائه میدهد. (www.sahebkhabar.ir)
چکیدهای از امکانات
- پوشش کامل چرخۀ تولید خبری
- مبتنی بر کارتابل
- انبارۀ متمرکز انواع فایل
- مدیریت باکسهای منعطف نمایشی خبری (تعریف و جانمایی انواع باکس نمایشی خبر نظیر آخرین اخبار، پربازدیدترین، تبلیغ، نظرسنجی و ...)
- موتور جستجوی قدرتمند نستوه با قابلیتهای متعددی منجمله فهم زبان فارسی، شباهت یابی و مفهوم یابی.
- استقرار توزیع شده بر روی سرورهای متعدد در مناطق جغرافیایی متفاوت
- تاریخچۀ تغییرات خبر
- افزودن فیلدهای دلخواه خبری (تعریف تعداد نامحدود قلم اطلاعاتی برای هر خبر)
- ویراستار خودکار آیین نگارش خبر
- اطلاعات جغرافیایی خبر GIS
- مدیریت کاربران و دسترسیها (تعریف منعطف هر گونه نقش با دسترسی دلخواه)
- نوع خبر
- منبع خبر
- مناطق خبری (به صورت درخت چند سطحی)
- کلیدواژههای خبری (چندسطحی با قابلیت ادغام)
- پروندههای خبری
- بولتن و خبرنامه
- آمار و گزارشها
- تبلیغات با امکانات حرفهای
- نظرسنجی
- آرشیو پیشرفته
- امکانات آنلاین ویرایش عکس
- ثبت سابقه
- کاربران برخط (online)
- اخبار چندرسانهای
- یادداشت (کامنت)
- خبرهای مشابه (دستی و خودکار)
- ارائهی سرویسهای RESTful
- مدیریت امنیتی لایهای
سامانهی پایش هرمس
مقدمه و کلیات سامانه
از مهمترین نیازمندیهای یک سازمان، اولاً آگاهی از اخبار عمومی و روز ایران و جهان و ثانیاً و مهمتر از آن، آگاهی و تحلیل اخبار اختصاصی و مرتبط با آن سازمان است. بسیاری از سازمانهای دانشمحور، حاکمیتی، مشاورهای، آموزشی و پژوهشی هم از بعد رسالت خود و هم آگاهی از اوضاع و احوال مرتبط با سازمان خود به اخبار خبرگزاریها نیازمندند. روشی که به طور سنتی در این حوزه مورد استفاده قرار میگرفته است، بهره بردن از نیروی انسانی برای مرور و یافتن اخبار مرتبط با سازمان بوده است. در این روش کار به شیوههای دستی و نیمهخودکار انجام میشود. به عنوان مثال کارشناس مربوطه در موتورهای جستجوی عمومی یا خبرگزاریهای مورد نظر به جستجوی اخبار مورد نظر خود میپرداخته. این روش هزینه و دشواری فراوانی دارد. از جمله عوامل مشکلزای این روش میتوان به: نبود امکان جستجوی یکپارچه، مشکلات فنی پایگاههای خبری، عدم امکان دستهبندی و مرور یکجای اخبار و همچنین نبود امکان فیلترینگ جامع و یکپارچه بر روی اخبار اشاره کرد.
سامانۀ رصد و پایش اخبار «هرمس» با هدف پوشش تمامی نیازهای یک روابط عمومی دیجیتال طراحی و پیادهسازی شده است. این سامانه با رصد ۲۴×۷ پایگاههای خبری داخلی و خارجی امکان پایش برخط و آنی آخرین رویدادهای ایران و جهان و همچنین آخرین تولیدات رسانهای مرتبط با یک سازمان را فراهم میکند. هرمس یک ربات پویشگر و تحلیلگر وب است که در حال حاضر برای دریافت و نمایهسازی اخبار و آنچه به خبر مرتبط است، طراحی شده، اما قابلیت دریافت و ذخیرۀ هرگونه محتوای دیجیتالی را داراست.
شرح فعالیت
ساختار
کلی روبات پویشگر هرمس در یک نگاه کلی بصورت شکل روبرو طراحی شده است.
این ربات به طور شبانهروزی به رصد پایگاههای خبری داخلی و خارجی میپردازد و پس از
ذخیرهسازی انواع محتوا اعم از متنی و چندرسانهای، شروع به آنالیز و تحلیل محتوا با
فاکتورهای متعدد خود مینماید. در انتها خروجی خود را در یک و یا چند قالب زیر ارائه
مینماید:
۱. سامانه رصد آنلاین
۲. بولتن قابل چاپ
۳. پیامک
۴. رایانامه (ایمیل)
یک نمونهی فعال از این سامانه در حال حاضر بر روی پایگاه خبری صاحبخبر به نشانی www.sahebkhabar.ir نصب
شده است و فعلاً برای تمامی کاربران اینترنت قابل دسترس است.
نمونه بولتنهای روزانه، ماهانه و تحلیل محتوا
نمونه یک بولتن روزانه را میتوانید از
این آدرس
دریافت کنید. (حجم ۲۵م)
یکی از انواع بولتنهای دیجیتال با قابلیت چاپ و نمایش واکنشگرا (ریسپانسیو) در
انواع دستگاههای موبایل، تبلت و رایانه رومیزی بولتن موضوعی روزانه است.
این بولتن روزانه به صورت خودکار یا دستی تولید میشود و در آن اقلام مختلف در
موضوعات مورد علاقهی مشتری گردآوری میشوند.
از جمله اقلام گردآوری شده میتوان به صفحه اول روزنامهها، اخبار سایتهای خبری و
خبرگزاریها، بریدهی روزنامهها به همراه متن کامل آنها و ... اشاره کرد.
نمونه یک بولتن تحلیل محتوای ماهانه را میتوانید از
این آدرس
دریافت کنید. (حجم ۱م)
این بولتن چکیده تحلیلی و سطح بالایی از اخباری است که روزانه در قالب بولتنهای
دیجیتال موضوعی در اختیار مخاطب قرار میگیرد.
در این بولتن به تفکیک منابع خبری و زیرموضوعات بولتن جزئیات آمار تولید ارائه شده است.
برخی اقلامی که با نگاه به این بولتن مشخص میشود:
۱. پرتولیدترین سایت خبری، خبرگزاری یا روزنامه در موضوعات خبری بولتن.
۲. پرخبرترین روز.
۳. پرتیراژترین اخبار بولتن.
۴. تعداد کل اخبار ماهانه به تفکیک موضوع
نمونه یک بولتن خاص مناسبتی را میتوانید از
این آدرس
دریافت کنید. (حجم ۱م)
این بولتن فشردهی اخبار پوشش داده شده در یک موضوع خاص خبری برای یک بازه مشخص است.
به عنوان مثال این بولتن اخبار پوشش داده شدهی توافق ژنو / لوزان را به تفکیک خبرگزاریهای
برتر ایران ارائه میکند.
نمونه یک بولتن تحلیل بازتاب ماهانه را
این آدرس
دریافت کنید. (حجم ۱م)
این بولتن که در قالب یک بستهی خبری با حدود ۳۰ گزارش متنوع به مشتریها، که عمدتاً خود
تولیدکنندگان اصلی خبر کشور هستند،
عرضه میشود برخی اقلام اطلاعاتی را که اختصاصا سامانهی هرمس قادر به تولید آن است ارائه
میکند.
در این بستهی تحلیلی اخبار بازتابی منابع اصلی در سایر منابع داخلی و بیگانه ارائه میشود. این
بازتاب به تفکیک سایت خبری، روزنامه و سایر خبرگزاریهای بازتابدهنده به ارائه آمار میپردازد.
برخی اقلام آماری که در این گزارش ارائه میشود عبارت است است:
۱. مقایسهی میزان تولید کل خبرگزاریها.
۲. مقایسهی رتبهی خبرگزاریها به لحاظ بازتاب اخبار آنها به طور کلی.
۲.۱. مقایسهی رتبهی خبرگزاریها به لحاظ بازتاب اخبار آنها در روزنامهها.
۲.۱.۱. مقایسهی رتبهی خبرگزاریها به لحاظ بازتاب اخبار آنها در صفحهی اول روزنامهها.
۲.۲. مقایسهی رتبهی خبرگزاریها به لحاظ بازتاب اخبار آنها در سایتهای خبری داخلی.
۲.۳. مقایسهی رتبهی خبرگزاریها به لحاظ بازتاب اخبار آنها در سایتهای خبری بیگانه.
۳. مقایسهی سرویسها و گروههای خبری به تفکیک بازتاب در سایتهای داخلی، بیگانه و روزنامهها.
۴. مقایسهی تعداد اخبار تعلیقی و حذفی به تفکیک سرویس.
۵. مقایسهی تعداد اخبار تغییریافته پس از انتشار. ارائهی آمارهی ضریب تغییر.
۶. ارائهی آمارهی ضریب بازتاب برای نشان دادن میزان اخبار بازتاب یافته برحسب تولید.
این بولتن فشردهی اخبار پوشش داده شده در یک موضوع خاص خبری برای یک بازه مشخص است.
به عنوان مثال این بولتن اخبار پوشش داده شدهی توافق ژنو / لوزان را به تفکیک خبرگزاریهای
برتر ایران ارائه میکند.
قابلیت ها
ربات هرمس به طور مکرر و در بازههای زمانی معین (بر اساس اهمیت پایگاه خبری) به پایگاههای خبری و روزنامهها سر میزند و تمامی فیلدهای خبری از جمله تیتر، عکس، روتیتر، بدنه، کلیدواژه و لید را استخراج میکند. ربات هرمس، همچنین میتواند هرگونه محتوایی در قالبهای متنوعی نظیر HTML, RSS, IMAGE, MOVIE را دریافت کند.
این سامانه علاوه بر اینکه میتواند نسخه RSS اخبار را ذخیره کند، همچنین نسخه اصلی منتشره در وب سایت را بصورت کامل، با استفاده از ربات خزنده خود ذخیره و آنالیز مینماید. صفحات شروع برای عملیات خزش، میتواند هر صفحهای اعم از صفحه اصلی ویا صفحات آرشیو باشد.
از مزیتهای هرمس، قابلیت اتصال آن به سامانهی اتاق خبر و سایت خبری است، که نمونهی آن هماکنون روی سایت صاحبخبر قابل دسترس است. کاربر سامانه میتوان با بهرهگیری از هرمس و اتاق خبر هر تعداد خبر مهم را از هرمس اخذ کند و به طور سیستماتیک به در سایت خود بازنشر دهد. به این ترتیب سرعت انتشار خبر به طور چشمگیری با کمترین هزینهی نیروی انسانی افزایش مییابد. همچنین کاربر میتواند خبرهای هرمس را به کارتابل خود منتقل کند و پس از اعمال تغییرات دلخواه، آنها را بر روی خروجی خود منتشر کند.
با هر نوع تحلیل آماری و متنی، امکان ارسال اخبار و یا نتایج تحلیلها بوسیله پیامک و ایمیل وجود دارد. مثلاً ارسال پیامکی آخرین اخبار سرویس فرهنگی یک خبرگزاری، پرتیراژترین اخبار ورزشی روز کشور، جریانهای خبری داغ، کپی اخباری که سایت ما منتشر کردهاند و ....
امکان ذخیرهی تمام تغییرات اعمالشده روی اخبار پس از انتشار وجود دارد. به بیان دیگر هرمس قابلیت ذخیرهی تاریخچهای از تغییراتی که روی هر خبر اعمال میشود را دارد و در صورت نیاز مدیر سامانه میتواند تمامی تغییراتی که ناشر از هنگام انتشار روی خبر اعمال کرده است را رصد کند. در نمایش تغییرات، بخش تغییر داده شده از متن، بصورت پررنگ و درکنار بخش قبلی کاملاً متمایز خواهد شد.
هرمس با تکنیکهای مختلف حذف خبر از روی یک پایگاه خبری را تشخصی میدهد و برای احترام به آن پایگاه خبری، خبر را از خروجی صاحبخبر نیز حذف میکند. به این ترتیب هرمس روزانه گزارشی از خبرهایی که هر خبرگزاری از خروجی خود حذف کرده است را ارائه میدهد.
در حال حاضر هرمس بیش از ۱۶۰ خبرگزاری، روزنامه و پایگاه خبری را مورد پوشش قرار داده که فهرستی از منابع داخلی آن در سایت صاحبخبر در بخش پایینی سایت، بخش منابع قابل مشاهده است. این منابع با سه معیار اعتبار خبری، داشتن تولید اختصاصی و همچنین داشتن حداقلی از بازدید روزانه و رتبهی بازدید در ایران انتخاب شدهاند. به علاوه حدود ۲۰ منبع بیگانهی فارسیزبان نیز در حال حاضر توسط سامانه مورد پوشش قرار دارد. لازم به توضیح است که که این پایگاهها بر اساس نیاز مشتری به هر تعداد قابل افزایش است.
از قابلیتهای برجستجه و منحصر به فرد این سامانه که بهدلیل وجود زیرساخت قوی موتور جستجوی بومی، طراحی و تولید آن ممکن شده است، امکان یافتن خودکار اخبار مشابه و اخبار کپیشده و بازنشر شده با قابلیت ارائۀ منبع اصلی خبر (اولین منتشر کننده) است. در رسانههای فارسیزبان کنونی، متأسفانه بسیاری از آنها صرفاً با تغییر در جملهها و تغییر تیتر خبر، به بازنشر اختصاصی خبر میپردازند که این بازنشر از چشم هرمس پنهان نمیماند.
با الگوریتم پیشبینی شده، بر اساس شباهت تیتر و لید و متن اصلی و کلیدواژههای خبر به درصد تشابه خبرها پی میبرد. این امکان به ویژه به کمک روابط عمومیها و تولیدکنندگان خبر میآید و آنها را از بازخورد خبری اخبار خود در دیگر رسانهها مطلع میکندو نیز مشخص میگردد که خبر تولیدی ما، در زنجیره گردش این خبر در دیگر خبرگزاریها، رتبه چندم را به لحاظ سرعت در اطلاعرسانی داراست.
از آنجایی که برخی پایگاهها سرویس خبری خود را ارائه نميکنند و عدم همخونی و انسجام معنایی میان سرویسهای خبری مابین پایگاههای خبری وجود دارد، هرمس در صورت فقدان سرویس خبری به طور خودکار از روی محتوای خبر، سرویس خبر را حدس میزند. در این فرایند از الگوریتمهای NLP برای زبان فارسی استفاده شده است.
تمامی اخبار دریافتی در موتور جستجو نمایه میشوند. در این
سامانه امکان جستجوی ساده و پیشرفته با قابلیت محدودسازی زمان تولید یا بازیابی
خبر، پایگاه خبری، جستجو در فیلدهای خبری همچون: عنوان، لید، بدنه، نویسنده،
یادداشت کاربران، کلیدواژهها و سرویس خبری وجود دارد. در تولید این موتور، از
شناختهشده ترین موتور منبعباز موجود یعنی Apache Solr استفاده شدهاست و با توسعه
آن و افزودن بخشهایی نظیر آنالیزور زبان فارسی، محصولی با ویژگیهای کلی زیر تولید
شدهاست:
آنالیزور زبان فارسی کاملاً اختصاصی با امکاناتی نظیر:
1- ریشهیاب زبان فارسی (Persian Stemmer)
2- فهم اشتقاق افعال فارسی و عربی دارای کاربرد در فارسی
3- استخراج ریشه اسامی از اسم جمع بستهشده و ذخیره ریشه و نام اصلی با اولویتهای
متفاوت
4- امکان چشمپوشی از حروف و کلمات خاص در جستجوگر و نمایهسازی
5- امکان استخراج اصل اسامی دارای پیشوند و پسوند
6- امکان استخراج مفردات از جمعهای با قاعده
7- استخراج ریشه اسامی از جمع های مکسر
8- حذف اعرابهای از پیش معین از واژهها
9- فهم لغات چنداملایی
10- دارای بانک استثنائات برای واژگان بیقاعده
11- دارای بانک کلیدواژههای مرتبط با قابلیت توسعه
هرمس تمام فیلدهای یک خبر را بصورت کاملاً مجزا ذخیرهسازی میکند که بدین وسیله میتوانیم وزن جستجوها را در فیلدهای مختلف تغییر دهیم ویا اساساً روی فیلدهای خاصی جستجو انجام دهیم. اهم این فیلدها عبارتست از: عنوان، روتیتر، زیرتیتر، لید، بدنهی خبر، جایگاه خبر در سایت مبدأ (مثلاً در تیتریک است یا در پربینندهها یا ...)، کلمات کلیدی، سرویس خبری، عکسهای خبر، سازنده، تاریخ انتشار، تاریخ تغییر، تغییرات انجام شده، اخبار مرتبط، کامنتهای منتشره.
هرمس بر خلاف دیگر نمونههای داخلی و خارجی قابلیت استخراج زمان دقیق «انتشار خبر» را از خروجی خبرگزاریها دارد. نرمافزارهای مشابه صرفاً میتوانند زمان دریافت خبر را ذخیره کنند و یا زمان انتشار را از روی RSS استخراج کنند، در حالی که هرمس برای استخراج زمان انتشار خبر نیازی به RSS ندارد و میتواند آنرا از تاریخ درج شده در کنار هر خبر استخراج کند.
هرمس به هیچ عنوان بار اضافیای بر سرورهای سایتهای خبری تحمیل نمیکند تا بتواند حداکثر پایداری خود را خوانش اخبار از آن سایتها حفظ کند.
هرمس میتواند خبرهایی که در تیتر یک، تیتر دو، تیتر سه، پیشنهاد سردبیر، پربازدید، پربحث و ... هر خبرگزاری آمده است را تشخیص دهد و جایگاه مبدأ آنرا ذخیره کند. در مورد روزنامهها سامانه به طور خودکار بریدهجراید مرتبط با مطلب روزنامه را نیز دریافت میکند.
با این امکان خاص، میتوان اولویت نمایش اخباری را که مثلاً در تیتریک منتشر شدهاند بالا برد و در تحلیل و ارائه اطلاعات آماری، به دقت بسیار بالاتری دست یافت.
با بهرهگیری از موتور جستجو و همچنین الگوریتم هوشمند یافتن خبرهای مشابه، هرمس مهمترین خبرها، و به بیان دیگر، پر تیراژترین اخبار را تشخیص میدهد و به کاربران عرضه میکند. این خبرها، خبرهایی هستند که پس از انتشار اولیه در یک منبع، در منابع متعددی بازنشر شدهاند و به همین دلیل میتوان گفت اهمیت زیادی دارند.
مهمترین جریانات خبری، از کلیدواژههای پرکاربرد اخبار استخراج میشوند. این جریانات و کلمات مهم خبری به تفکیک سرویس قابلیت نمایش دارند.